特征值和特征向量

Eigenvalues and Eigenvectors

一、基本定义和几何意义

\begin{array}{r} A \vec{x} = λ \vec{x} \end{array}

$λ$ 为特征值 $\vec{x}$ 为特征向量

直观上的理解：当矩阵作用于向量时，大多数向量会改变方向，但是有某些向量不会改变方向，而只是在同一方向上伸缩。其中：不改变方向的向量为特征向量，伸缩的倍数为特征值。

二、计算特征值和特征向量

特征方程：

\begin{array}{r} (A - λ E) \vec{x} = 0 \end{array}

特征多项式：

\begin{array}{r} f (λ) = det (A - λ E) = | \begin{array}{c} a_{11} - λ & a_{12} & \dots & a_{1 n} \\ a_{21} & a_{22} - λ & \dots & a_{2 n} \\ ⋮ & ⋮ & ⋱ & ⋮ \\ a_{n 1} & a_{n 2} & \dots & a_{n n} - λ \end{array} | = 0 \end{array}

从线性方程组的角度看：特征方程实质上为齐次线性方程组，有非零解的充分必要条件是系数行列式 $| A - λ E | = 0$ 为 0，可以求得特征值、进而求的特征向量
从向量空间的角度看：特征向量 $\vec{x}$ 在 $A - λ E$ 的零空间中，如果 $λ = λ_{i}$ 为矩阵 $A$ 的一个特征值, 则 $(A - λ_{i} E) \vec{x} = 0$ 可以求得非零解 ${\vec{x}}_{i}$ ，求得的解向量为 $λ = λ_{i}$ 对应的特征向量

三、迹和行列式

可以通过矩阵本身，快速得到特征值的和与积

特征值之和等于矩阵的迹（对角线之和）

λ_{1} + λ_{2} + \dots + λ_{n} = a_{11} + a_{22} + \dots + a_{n n} = t r (A)

特征值之积为矩阵的行列式

λ_{1} λ_{2} \dots λ_{n} = | A |

实矩阵的复数特征值

如果矩阵有复数的特征值，则特征值一定共轭。
设特征值为 $λ = a + i b, \overset{―}{λ} = a - i b$

\begin{array}{r} A x = λ x A \overset{―}{x} = \overset{―}{λ} \overset{―}{x} \end{array}

实际应用

最重要的应用：矩阵对角化
稳定性分析：在控制理论中，系统稳定性的分析依赖于系统矩阵的特征值的实部。
数据降维：主成分分析（PCA）中，特征向量帮助确定数据的主要变化方向。

AI 结构化补充（2026-05-02）

Eigenvalues and Eigenvectors

一、基本定义和几何意义

\begin{array}{r} A \vec{x} = λ \vec{x} \end{array}

$λ$ 为特征值 $\vec{x}$ 为特征向量

严格说， $A$ 必须是方阵，且 $\vec{x} \neq 0$ ；零向量虽然满足许多齐次等式，但不作为特征向量。

二、计算特征值和特征向量

特征方程：

\begin{array}{r} (A - λ E) \vec{x} = 0 \end{array}

特征多项式：

\begin{array}{r} f (λ) = det (A - λ E) = | \begin{array}{c} a_{11} - λ & a_{12} & \dots & a_{1 n} \\ a_{21} & a_{22} - λ & \dots & a_{2 n} \\ ⋮ & ⋮ & ⋱ & ⋮ \\ a_{n 1} & a_{n 2} & \dots & a_{n n} - λ \end{array} | = 0 \end{array}

从线性方程组的角度看：特征方程实质上为齐次线性方程组，有非零解的充分必要条件是系数行列式 $| A - λ E | = 0$ 为 0，可以求得特征值、进而求的特征向量
从向量空间的角度看：特征向量 $\vec{x}$ 在 $A - λ E$ 的零空间中，如果 $λ = λ_{i}$ 为矩阵 $A$ 的一个特征值, 则 $(A - λ_{i} E) \vec{x} = 0$ 可以求得非零解 ${\vec{x}}_{i}$ ，求得的解向量为 $λ = λ_{i}$ 对应的特征向量

三、迹和行列式

可以通过矩阵本身，快速得到特征值的和与积

特征值之和等于矩阵的迹（对角线之和）

λ_{1} + λ_{2} + \dots + λ_{n} = a_{11} + a_{22} + \dots + a_{n n} = t r (A)

特征值之积为矩阵的行列式

λ_{1} λ_{2} \dots λ_{n} = | A |

实矩阵的复数特征值

如果矩阵有复数的特征值，则特征值一定共轭。
设特征值为 $λ = a + i b, \overset{―}{λ} = a - i b$

\begin{array}{r} A x = λ x A \overset{―}{x} = \overset{―}{λ} \overset{―}{x} \end{array}

实际应用

计算路线与快速校验

特征值问题的几何起点是

A x = λ x, x \neq 0.

特征值 $λ$ 描述该方向被拉伸、压缩、反向或压到零；当 $λ = 0$ 时，对应特征向量就在 $A$ 的零空间中。计算时先解

det (A - λ I) = 0

得到特征值，再把每个根代回 $(A - λ I) x = 0$ 求对应特征向量。迹与行列式提供快速校验：特征值之和等于 $tr A$ ，特征值之积等于 $det A$ 。

不变方向的运算规则

若

A x = λ x,

则同一个特征向量方向在若干常见矩阵运算下保持不变：

A^{2} x = λ^{2} x, A^{- 1} x = λ^{- 1} x, (A + c I) x = (λ + c) x .

其中 $A^{- 1}$ 这一条要求 $A$ 可逆，也等价于这个特征值不为 $0$ 。更一般地，矩阵的高次幂不会混合已经分解到特征向量方向上的分量；每个方向只被自己的特征值反复缩放。因此特征值问题把复杂的向量演化拆成若干一维伸缩。

Markov 矩阵中的稳定方向

设

A = (\begin{matrix} 0.8 & 0.3 \\ 0.2 & 0.7 \end{matrix}) .

它的特征方程为

det (A - λ I) = λ^{2} - \frac{3}{2} λ + \frac{1}{2} = (λ - 1) (λ - \frac{1}{2}),

所以特征值为 $1$ 与 $\frac{1}{2}$ 。对应特征向量可取

x_{1} = (\begin{matrix} 0.6 \\ 0.4 \end{matrix}), x_{2} = (\begin{matrix} 1 \\ - 1 \end{matrix}) .

$x_{1}$ 是稳定方向，因为 $A x_{1} = x_{1}$ ； $x_{2}$ 是衰减方向，因为 $A x_{2} = \frac{1}{2} x_{2}$ 。第一列可以写成

(\begin{matrix} 0.8 \\ 0.2 \end{matrix}) = x_{1} + 0.2 x_{2},

于是

A^{99} (\begin{matrix} 0.8 \\ 0.2 \end{matrix}) = x_{1} + 0.2 {(\frac{1}{2})}^{99} x_{2} .

这解释了为什么高次幂的列趋近于同一个稳定向量：

A^{100} \approx (\begin{matrix} 0.6000 & 0.6000 \\ 0.4000 & 0.4000 \end{matrix}) .

投影、反射与零特征值

投影矩阵的特征值只可能是 $1$ 或 $0$ 。例如

P = (\begin{matrix} 0.5 & 0.5 \\ 0.5 & 0.5 \end{matrix})

满足

P (\begin{matrix} 1 \\ 1 \end{matrix}) = (\begin{matrix} 1 \\ 1 \end{matrix}), P (\begin{matrix} 1 \\ - 1 \end{matrix}) = 0.

因此 $λ = 1$ 的特征向量填满投影保留的列空间， $λ = 0$ 的特征向量填满被压到零的零空间。反射矩阵

R = (\begin{matrix} 0 & 1 \\ 1 & 0 \end{matrix}) = 2 P - I

有相同的两个特征向量，但特征值变为 $1$ 与 $- 1$ ：方向 $(1, 1)^{T}$ 不变，方向 $(1, - 1)^{T}$ 被反向。

零特征值没有特殊禁忌。它的含义只是存在非零向量 $x$ 使 $A x = 0$ ，即 $x$ 在零空间中；因此方阵奇异当且仅当 $0$ 是一个特征值。

奇异矩阵例子

对

A = (\begin{matrix} 1 & 2 \\ 2 & 4 \end{matrix}),

有

det (A - λ I) = (1 - λ) (4 - λ) - 4 = λ^{2} - 5 λ = λ (λ - 5) .

所以特征值为 $0$ 与 $5$ 。对应特征向量可取

λ = 0 : x = (\begin{matrix} 2 \\ - 1 \end{matrix}), λ = 5 : x = (\begin{matrix} 1 \\ 2 \end{matrix}) .

这里 $λ = 0$ 来自矩阵本身奇异， $λ = 5$ 来自平移后的矩阵 $A - 5 I$ 奇异。任一特征向量的非零倍数仍是同一特征值的特征向量。

AB 与 A+B 的常见误区

一般不能把 $A$ 与 $B$ 的特征值直接相乘得到 $A B$ 的特征值，也不能直接相加得到 $A + B$ 的特征值。问题出在特征向量不一定共享。

若 $x$ 同时满足

A x = λ x, B x = β x,

则

A B x = A (β x) = β A x = β λ x,

并且

(A + B) x = (λ + β) x .

但这只对同一个公共特征向量成立。反例是

A = (\begin{matrix} 0 & 1 \\ 0 & 0 \end{matrix}), B = (\begin{matrix} 0 & 0 \\ 1 & 0 \end{matrix}) .

$A$ 与 $B$ 的特征值全为 $0$ ，可是

A B = (\begin{matrix} 1 & 0 \\ 0 & 0 \end{matrix}), A + B = (\begin{matrix} 0 & 1 \\ 1 & 0 \end{matrix})

分别出现特征值 $1$ ，以及 $1, - 1$ 。如果 $A$ 与 $B$ 有一组共同的 $n$ 个线性无关特征向量，则可以在这些方向上逐一相乘或相加特征值，这正是共同特征向量条件的意义。

基与对角化的边界

特征向量最有用的情形，是它们组成一组基。这样任意向量都可以分解到特征方向上，矩阵的幂、逆和平移都按一维规则处理。若一个 $2 \times 2$ 矩阵只有一条特征向量直线，即使代数上有重特征值，也不能得到完整特征向量基，因而不能直接对角化。单位矩阵是相反的极端：它的特征值全为 $1$ ，但每个非零向量都是特征向量。